智能论文笔记

Efficiently Learning Any One Hidden Layer ReLU Network From Queries

Sitan Chen , Adam R Klivans , Raghu Meka

分类：机器学习

2021-11-08

模型提取攻击已经再次兴趣了解来自查询的神经网络的经典问题。在这项工作中，我们给出了学习任意一个隐藏层神经网络激活的第一个多项式时间算法，提供了对网络的黑盒访问。正式，我们表明，如果$ F $是一个具有Relu激活的任意一个隐藏的层神经网络，则存在一个具有Query复杂性和运行时间的算法，这些复杂性和运行时间在所有参数中输出网络$ f'$实现低平方丢失相对达到高斯措施的$ F $。虽然安全文献中的许多作品已经提出和经验证明了某些算法的有效性，但是，即使对于最坏情况的网络，我们也是最完全多项式时间对效率保证的影响（特别是我们的算法在整个算法中取得成功）环境）。

translated by 谷歌翻译

DoSA : A System to Accelerate Annotations on Business Documents with Human-in-the-Loop

Neelesh K Shukla , Msp Raja , Raghu Katikeri , Amit Vaid

分类：自然语言处理

2022-11-09

Business documents come in a variety of structures, formats and information needs which makes information extraction a challenging task. Due to these variations, having a document generic model which can work well across all types of documents and for all the use cases seems far-fetched. For document-specific models, we would need customized document-specific labels. We introduce DoSA (Document Specific Automated Annotations), which helps annotators in generating initial annotations automatically using our novel bootstrap approach by leveraging document generic datasets and models. These initial annotations can further be reviewed by a human for correctness. An initial document-specific model can be trained and its inference can be used as feedback for generating more automated annotations. These automated annotations can be reviewed by human-in-the-loop for the correctness and a new improved model can be trained using the current model as pre-trained model before going for the next iteration. In this paper, our scope is limited to Form like documents due to limited availability of generic annotated datasets, but this idea can be extended to a variety of other documents as more datasets are built. An open-source ready-to-use implementation is made available on GitHub https://github.com/neeleshkshukla/DoSA.

translated by 谷歌翻译

Two-dimensional total absorption spectroscopy with conditional generative adversarial networks

Cade Dembski , Michelle P. Kuchera , Sean Liddick , Raghu Ramanujan , Artemis Spyrou

分类：人工智能

2022-06-23

我们探索了使用机器学习技术来消除实验光谱中大量$ \ gamma $ ray检测器的响应。分段$ \ gamma $ -Ray总吸收光谱仪（TAS）允许同时测量单个$ \ gamma $ -ray $ -Ray-ray Energy（e $ _ \ gamma $）和总激发能量（E $ _X $）。 TAS检测器数据的分析使E $ _X $和E $ _ \ gamma $数量相关联，因此与使用E $ _x $和E $ _ \ gamma $响应函数相关的技术是复杂的，因此不那么准确。在这项工作中，我们调查了有条件生成的对抗网络（CGAN）同时展开$ e_ {x} $和$ e _ {\ gamma} $ data在TAS检测器中的数据。具体而言，我们采用PIX2PIX CGAN，这是一种基于深度学习进展的生成建模技术，以处理$（e_x，e _ {\ gamma}）$矩阵作为图像到图像翻译问题。我们提出了单个 - $ \ gamma $和double-$ \ gamma $ decay cascades的模拟和实验矩阵的结果。我们的模型展示了检测器分辨率限制内的表征功能，其模拟测试用例$ 90 \％$。

translated by 谷歌翻译

EyeNeRF: A Hybrid Representation for Photorealistic Synthesis, Animation and Relighting of Human Eyes

Gengyan Li , Abhimitra Meka , Franziska Müller , Marcel C. Bühler , Otmar Hilliges

分类：计算机视觉

2022-06-16

创建高质量的动画和可重新可靠的3D人体化身的独特挑战是对人的眼睛进行建模。合成眼睛的挑战是多重的，因为它需要1）适当的表示眼和眼周区域的适当表示，以进行连贯的视点合成，能够表示弥漫性，折射和高度反射表面，2）2）脱离皮肤和眼睛外观这样的照明使其可以在新的照明条件下呈现，3）捕获眼球运动和周围皮肤的变形以使重新注视。传统上，这些挑战需要使用昂贵且繁琐的捕获设置来获得高质量的结果，即使那样，整体上的眼睛区域建模仍然难以捉摸。我们提出了一种新颖的几何形状和外观表示形式，该形式仅使用一组稀疏的灯光和摄像头，可以捕获高保真的捕获和感性动画，观察眼睛区域的综合和重新定位。我们的杂种表示将眼球的显式参数表面模型与眼周区域和眼内部的隐式变形体积表示结合在一起。这种新颖的混合模型旨在解决具有挑战性的面部面积的各个部分 - 明确的眼球表面允许在角膜处建模折射和高频镜面反射，而隐性表示非常适合通过模拟低频皮肤反射。球形谐波可以代表非表面结构，例如头发或弥漫性体积物体，这两者都是显式表面模型的挑战。我们表明，对于高分辨率的眼睛特写，我们的模型可以从看不见的照明条件下的新颖观点中综合高保真动画的目光。

translated by 谷歌翻译

On the fast convergence of minibatch heavy ball momentum

Raghu Bollapragada , Tyler Chen , Rachel Ward

分类：机器学习 | (统计)机器学习

2022-06-15

简单的随机动量方法被广泛用于机器学习优化，但它们的良好实践表现与文献中没有理论保证的理论保证相矛盾。在这项工作中，我们的目标是通过表明随机重球动量来弥合理论和实践之间的差距，该动力可以解释为具有动量的随机kaczmarz算法，保留了二次优化问题（确定性）重球动量的快速线性速率，至少在使用足够大的批次大小的小型匹配时。该分析依赖于仔细分解动量过渡矩阵，并使用新的光谱范围浓度界限来进行独立随机矩阵的产物。我们提供数值实验，以证明我们的边界相当锐利。

translated by 谷歌翻译

Matching Papers and Reviewers at Large Conferences

Kevin Leyton-Brown , Mausam , Yatin Nandwani , Hedayat Zarkoob , Chris Cameron , Neil Newman , Dinesh Raghu

分类：人工智能

2022-02-24

CS中的主要出版物场所进行的同行评审会议务必依赖每篇论文的高素质审阅者。由于这些会议的规模越来越大，它们的工作时间表以及最近明显不诚实的行为激增，现在没有其他选择以自动化的方式进行这种匹配。本文研究了一种新颖的审阅者纸匹配方法，该方法最近在第35届AAAI人工智能会议（AAAI 2021）中部署，此后已被包括ICML 2022，AAAAI 2022和IJCAI 2022的其他会议（全部或部分）采用（完全或部分）。该方法具有三个主要元素：（1）收集和处理输入数据以识别有问题的匹配并生成审阅者纸得分；（2）制定和解决优化问题，以找到良好的审阅者纸匹配；（3）两阶段的审查过程，将审查资源从可能被拒绝的论文转移到更接近决策界的文件。本文还根据对真实数据的大量事后分析进行了对这些创新的评估，包括与AAAI先前（2020年）迭代中使用的匹配算法进行比较 - 并通过其他数值实验对此进行了补充。

translated by 谷歌翻译

VoLux-GAN: A Generative Model for 3D Face Synthesis with HDRI Relighting

Feitong Tan , Sean Fanello , Abhimitra Meka , Sergio Orts-Escolano , Danhang Tang , Rohit Pandey , Jonathan Taylor , Ping Tan , Yinda Zhang

分类：计算机视觉

2022-01-13

我们提出Volux-GaN，一种生成框架，以合成3D感知面孔的令人信服的回忆。我们的主要贡献是一种体积的HDRI可发感方法，可以沿着每个3D光线沿着任何所需的HDR环境图累计累积Albedo，漫射和镜面照明贡献。此外，我们展示了使用多个鉴别器监督图像分解过程的重要性。特别是，我们提出了一种数据增强技术，其利用单个图像肖像结合的最近的进步来强制实施一致的几何形状，反照镜，漫射和镜面组分。与其他生成框架的多个实验和比较展示了我们的模型是如何向光电型可致力于的3D生成模型前进的一步。

translated by 谷歌翻译

Automated Reinforcement Learning (AutoRL): A Survey and Open Problems

Jack Parker-Holder , Raghu Rajan , Xingyou Song , André Biedenkapp , Yingjie Miao , Theresa Eimer , Baohe Zhang , Vu Nguyen , Roberto Calandra , Aleksandra Faust

分类：机器学习

2022-01-11

深入学习的强化学习（RL）的结合导致了一系列令人印象深刻的壮举，许多相信（深）RL提供了一般能力的代理。然而，RL代理商的成功往往对培训过程中的设计选择非常敏感，这可能需要繁琐和易于易于的手动调整。这使得利用RL对新问题充满挑战，同时也限制了其全部潜力。在许多其他机器学习领域，AutomL已经示出了可以自动化这样的设计选择，并且在应用于RL时也会产生有希望的初始结果。然而，自动化强化学习（AutorL）不仅涉及Automl的标准应用，而且还包括RL独特的额外挑战，其自然地产生了不同的方法。因此，Autorl已成为RL中的一个重要研究领域，提供来自RNA设计的各种应用中的承诺，以便玩游戏等游戏。鉴于RL中考虑的方法和环境的多样性，在不同的子领域进行了大部分研究，从Meta学习到进化。在这项调查中，我们寻求统一自动的领域，我们提供常见的分类法，详细讨论每个区域并对研究人员来说是一个兴趣的开放问题。

translated by 谷歌翻译

Self-supervision of wearable sensors time-series data for influenza detection

Arinbjörn Kolbeinsson , Piyusha Gade , Raghu Kainkaryam , Filip Jankovic , Luca Foschini

分类：机器学习

2021-12-27

自我监督可能会在下游任务中提高模型性能。但是，没有理性的方法可以选择产生最适应性最适应的模型的自我监督目标。在这里，我们研究了从可穿戴传感器产生的每日时间序列数据上的这个问题，用于检测流感样疾病（ILI）的开始。我们首先表明，使用自我监督的学习来预测下一天的时间序列值允许我们学习丰富的表示，这可以适应执行准确的ILI预测。其次，我们对三种不同的自我监督目标进行了实证分析，以评估其对伊利预测的适应性。我们的结果表明，在睡眠期间预测第二天休息的心率或床上床提供了更好的ILI预测表示。这些调查结果增加了以前的工作，展示了自我监督学习从活动数据的实际应用，以改善健康预测。

translated by 谷歌翻译

A Deep Learning Approach for Ontology Enrichment from Unstructured Text

Lalit Mohan Sanagavarapu , Vivek Iyer , Raghu Reddy

分类：自然语言处理

2021-12-16

网络世界中的信息安全是令人关切的主要原因，攻击表面的数量显着增加。网络上可用的漏洞，攻击，控件和建议的现有信息提供了代表知识并执行安全分析以减轻一些问题的机会。代表本体形式的安全知识有助于异常检测，威胁情报，推理和相关攻击的相关性归因等。这需要动态和自动丰富信息安全本体。然而，基于自然语言处理和ML模型的现有本体富集算法具有语文提取词，短语和句子的上下文提取问题。这激励了对遍历文本中的依赖路径的顺序深度学习架构的需求，并提取嵌入漏洞，威胁，控件，产品和其他安全相关概念和来自学习的路径表示的实例。在所提出的方法中，部署了在大型DBPedia数据集和Wikipedia语料库上培训的双向LSTMS与Universal Stank编码器一起培训，以丰富基于ISO 27001的信息安全本体。该模型在高性能计算（HPC）环境上进行培训并测试，以处理Wiki文本维度。当从本体论和网页实例的敲除概念测试以验证稳健性时，该方法产生了超过80％的测试精度。

translated by 谷歌翻译